查看原文
其他

不比不知道,我再也不敢用DAVID了

Y叔叔 YuLabSMU 2023-06-15

你昨天才做的分析,可能是几年前的结果!》之前这篇文章,大家应该还记得,这就是富集分析软件的现状,虽然软件很多,但问题同样也很多。

这一篇Nature Methods的文章告诉我们,42%的软件超过5年没更新,只能捕获当前知识的26%。

首当其冲的是DAVID,你看它文章的引用数(红色线),2015年直逼6000, 而知识的完整度(蓝色线),一路下降,到2015年只有20%而已。这篇Nature Methods文章的强力吐槽,也促使了DAVID做了一次更新。

然而在2016年更完之后,呵呵,又一个5年过去了,仍然是一动也没动过。随着时间的推移,知识的完整度又一步步地下降,你每次用DAVID,都是梦回2016。差别大概可以参考下图:

你的结论只能反映学界五年前的生物学知识积累。在最近一次更新之前,之前写的《SCIENCE文章用了DAVID被吐槽》大家可能没印象了,我建议你打开看看。

故事大概是文章一发表Pubpeer上马上有人吐槽,然后作者也去承认,确实是有问题。


然后就有人来找我出来遛一遛。


不遛不知道,一吓一跳,这个大家看看《SCIENCE文章用了DAVID被吐槽》这篇就行了。

今天不是来炒冷饭的,而是真的有新的发现。在《文章发表:clusterProfiler 4.0 -- The Innovation》一文中,我们也谈到了这个数据完整性的问题,审稿人提出来,DAVID后面又更新了一次,是不是再出来一下?于是我就再次看看。拿clusterProfilerDAVID当前最新版(其实也是5年前的版本),再比较一下。

我当前有个比较结果,五年前有个比较结果,如果放在一起看呢?是不是比较有意思?呗,结果如下:

结论1clusterProfiler的结果稍有出入,但变动不大。这是符合期望的,DAVID的结果都被clusterProfiler囊括了,这也是符合期望的,总之就是正如我们期望的,clusterProfiler靠谱!

结论2DAVID两个版本的结果,竟然几乎完全没有重叠,这太让人震惊了,震惊到我都打错字了。

也就是说SCIENCE那篇文章,在分析的时间点上,如果DAVID是有及时更新的话,那SCIENCE那篇文章上的结论是第二列的结果,然而由于DAVID没更新,文章用的是第一列的结果。这尼马结论相差也太大了吧。

再者同一份数据,DAVID两次不同的更新,竟然给出完全没有交集的分析结果,完全超越了我们的想象。好了,现在DAVID又超过5年没更新了,假如有更新的话,是不是又要给出不一样的结果呢?画面太美,我不敢想。

你可能认为软件多的是,大不了不用DAVID,然而可不单单DAVID有问题哦,不信你再看看下面两篇文章:

最后的最后,来自Y叔叔的叮嘱:

  • 要想富集分析靠谱,快用clusterProfiler!
  • 要想富集分析应用于不同的物种,包括各种非模式生物,快用clusterProfiler!
  • 要想富集分析应用于不同的知识库,快用clusterProfiler!
  • 要想富集分析结果可以比较,快用clusterProfiler!
  • 要想富集分析出图漂亮,快用clusterProfiler!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存